•
•
•
•
仮説H1
仮説H2
仮説HN :
データD
P(仮説|データ)
• ! "#
$ "#|! = $ !|"# $ "#
∑()#* $ ! ∩ "(
= $ !|"# $ "#
∑()#* $ !|"( $ "(
= $ !|"# $ "#
$ !
H1 D H2 D H3 D H4 D データD
H1 H2 H3 H4
• P( | )
•
• P( | )
•
P( | )
•
• ! " ! #|"
! "|#
! "|# = ! #|" ! "
! #
事後確率 尤度 事前確率
仮説H1
仮説H2
仮説HN :
データD
尤度P(データ|仮説) 仮説H1
仮説H2
仮説HN
事後確率 :
P(仮説|データ) 事前確率
P(仮説)
•
•
•
•
•
•
•
•
•
•
•
•
戦術S1
戦術S2
戦術SN :
勝利V
尤度P(勝利|戦術) 戦術
S1 戦術S2
戦術SN : 事後確率P(戦術|勝利)
事前確率
P(戦術) 負け
¬V
"1
$ "1|! = $ !|"1 $ "1
$ !
•
• ! ! !
!
S1 V S2 V S3 V S4 V 勝利V
戦術
S1 S2 S3 S4
•
P(V|S1)
=3/5 P(V|S2)
=1/2 P(V|S3)
=1/2 P(V|S4)
=3/4 勝利V
戦術S
P(S1) P(S2) P(S3) P(S4)
1)
2)
P(S1 V) P(S2 V) P(S3 V) P(S4 V) 勝利V
戦術S
P(S1)
=1/4 P(S2)
=1/4 P(S3)
=1/4 P(S4)
=1/4
•
! " = $
%&' (
! "|*+ ! *+ = 3 5 . 1
4 + 1 2 . 1
4 + 1 2 . 1
4 + 3 4 . 1
4
= 0.5875
• ⇒"($1) = "($2) = "($3) = "($4) = 1/4
" $1|- = " -|$1 " $1
" - = 3 5 0⁄ 1 4⁄
0.5875 ≈ 0.255
•
! "1|% ≈ 0.255
! "2|% ≈ 0.213
! "3|% ≈ 0.213
! "4|% ≈ 0.319
S1 V
=60試合 S2 V
=5試合 S3 V
=25試合 S4 V
=30試合 勝利V
戦術
S1=100試合 S2=10試合 S3=50試合 S4=40試合 S1 ¬V
=40試合 S2 ¬V
=5試合 S3 ¬V
=25試合 S4 ¬V
=10試合
•
! " = $
%&' (
! "|*+ ! *+
= 60
100 / 100
200 + 5
10 / 10
200 + 25
50 / 50
200 + 30
40 / 40
200 = 0.6
• !1
# !1|% = # %|!1 # !1
# % = 3 5 *⁄ 1 2⁄
0.6 = 0.5
•
! "1|% = 0.500
! "2|% = 0.042
! "3|% = 0.208
! "4|% = 0.250
! "1|% ≈ 0.255
•
! "1|% = 0.500
•
仮説H1 仮説H2
仮説HN :
データD 尤度
仮説H1 仮説H2
仮説HN : 事後確率 事前確率
事後確率を事前確率として更新
• (0) (0)
• (1) (0) ← 1
• (1) (1)
• (2) (1) ← 2
• (2) (2)
• (n) (n-1) ← n
• (n) (n)
•
! " #$ = ! " #$|' ≈ 0.255
! $ #$|' = ! $ '|#$ ! $ #$
! $ ' ≈ 0.253
! $ #.|' ≈ 0.176
! $ #2|' ≈ 0.176
! $ #3|' ≈ 0.395
! " #$ = ! $ #$|' ≈ 0.253
! " #$|' = ! " '|#$ ! " #$
! " ' ≈ 0.243
! " #"|' ≈ 0.141
! " #0|' ≈ 0.141
! " #1|' ≈ 0.475
•
• !4
P(V|S1) P(V|S2尤度) P(V|S3) P(V|S4) 0.60 0.50 0.50 0.75
更新回数 事前確率 勝率 事後確率
P(S1) P(S2) P(S3) P(S4) P(V) P(S1|V) P(S2|V) P(S3|V) P(S4|V) 0 0.250 0.250 0.250 0.250 0.588 0.255 0.213 0.213 0.319 1 0.255 0.213 0.213 0.319 0.605 0.253 0.176 0.176 0.395 2 0.253 0.176 0.176 0.395 0.624 0.243 0.141 0.141 0.475 3 0.243 0.141 0.141 0.475 0.643 0.227 0.109 0.109 0.554
: : : : : : : : : :
29 0.002 0.000 0.000 0.998 0.750 0.001 0.000 0.000 0.999 30 0.001 0.000 0.000 0.999 0.750 0.001 0.000 0.000 0.999
勝ち続けるとS4への 信頼度が高まる
0.0##
0.2##
0.4##
0.6##
0.8##
1.0##
1.2##
0# 2# 4# 6# 8# 10# 12# 14# 16# 18# 20# 22# 24# 26# 28# 30#
P(S1)#
P(S2)#
P(S3)#
P(S4)#
!4
• !4
P(V|S1) P(V|S2尤度) P(V|S3) P(V|S4) 0.60 0.50 0.50 0.75
更新回数 事前確率 勝率 事後確率
P(S1) P(S2) P(S3) P(S4) P(V) P(S1|V) P(S2|V) P(S3|V) P(S4|V) 0 0.500 0.050 0.250 0.200 0.600 0.500 0.042 0.208 0.250 1 0.500 0.042 0.208 0.250 0.613 0.490 0.034 0.170 0.306 2 0.490 0.034 0.170 0.306 0.626 0.470 0.027 0.136 0.367 3 0.470 0.027 0.136 0.367 0.639 0.441 0.021 0.106 0.431
: : : : : : : : : :
29 0.004 0.000 0.000 0.996 0.749 0.003 0.000 0.000 0.997 30 0.003 0.000 0.000 0.997 0.750 0.002 0.000 0.000 0.998
勝ち続けると、S4に 対する信頼度が高まる
0.0##
0.2##
0.4##
0.6##
0.8##
1.0##
1.2##
0# 2# 4# 6# 8# 10# 12# 14# 16# 18# 20# 22# 24# 26# 28# 30#
P(S1)#
P(S2)#
P(S3)#
P(S4)#
!4
•
•
!4
# !4
•
• 4 ("1, "2, "3, "4)
• P( | )
• !4
• !1 ($1)
&($1|!1)
v1 s1 v2 s1 戦術s1
勝敗
勝ちv1 負けv2
勝ちv1
負けv2
戦術s1 尤度 P(戦術|勝敗)
勝ちv1
負けv2 事後確率P(勝敗|戦術)
事前確率P(勝敗)
: 戦術s2
戦術sn
•
•
s1 s2 s3 s4 合計 勝ちv1 25 10 25 35 95 負けv2 15 15 20 40 90 合計 40 25 45 75 185
•
• !4
!1
• !4 !1
•
• !1
P(s1|v1)=5/19 P(s1|v2)=1/6 戦術s1
勝ちP(v勝敗 1) 負けP(v2)
P(¬s1|v1)=14/19 P(¬s1|v2)=5/6
•
•
!(#1) = !(#2) = 1/2
P(s1|v1)=5/19 P(s1|v2)=1/6 戦術s1
勝ちP(v勝敗 1)=1/2 負けP(v2)=1/2
P(¬s1|v1)=14/19 P(¬s1|v2)=5/6
•
! "#|%# = ! %#|"# ! "#
! %#
= ! %#|"# ! "#
! %#|"# ! "# + ! %#|"( ! "(
= 5 19 -⁄ 1 2⁄
⁄
5 19 - 1 2 +⁄ 1 6 -⁄ 1 2⁄ ≈ 0.612
• s1
P(s1|v尤度1)P(s1|v2) 0.263 0.167
更新回数 事前確率 選択率 事後確率
P(v1) P(v2) P(s1) P(v1|s1)P(v2|s1) 0 0.500 0.500 0.215 0.612 0.388 1 0.612 0.388 0.226 0.714 0.286 2 0.714 0.286 0.236 0.797 0.203 3 0.797 0.203 0.244 0.861 0.139
: : : : : :
16 0.999 0.001 0.263 1.000 0.000 17 1.000 0.000 0.263 1.000 0.000
0.0##
0.2##
0.4##
0.6##
0.8##
1.0##
1.2##
0# 1# 2# 3# 4# 5# 6# 7# 8# 9# 10#11#12#13#14#15#16#17#18#19#20#
P(v1)#
P(v2)#
! "#|%# = ! %#|"# ! "#
! %#
= ! %#|"# ! "#
! %#|"# ! "# + ! %#|"( ! "(
= 5 19 -⁄ 95 185⁄
5 19 -⁄ 95 185 +⁄ 1 6 -⁄ 90 185⁄ ≈ 0.725
•
• s1
P(s1|v尤度1)P(s1|v2) 0.263 0.167
更新回数 事前確率 選択率 事後確率
P(v1) P(v2) P(s1) P(v1|s1)P(v2|s1) 0 0.625 0.375 0.227 0.725 0.275 1 0.725 0.275 0.237 0.806 0.194 2 0.806 0.194 0.244 0.868 0.132 3 0.868 0.132 0.250 0.912 0.088
: : : : : :
15 0.999 0.001 0.263 1.000 0.000 16 1.000 0.000 0.263 1.000 0.000
0.0##
0.2##
0.4##
0.6##
0.8##
1.0##
0# 1# 2# 3# 4# 5# 6# 7# 8# 9# 10#11#12#13#14#15#16#17#18#19#20#
P(v1)#
P(v2)#
• s1 s4
0.0##
0.2##
0.4##
0.6##
0.8##
1.0##
1.2##
0# 3# 6# 9# 12#15#18#21#24#27#30#33#36#39#42#45#48#51#54#57#60#
P(v1|s1)#
P(v1|s4)#
…
•
• !4
#1 #1 #1 #1 #1
• #1
!1
• !1
•
•
•
•
s1の尤度 s1以外の尤度 P(s1|v1)P(s1|v2)P(¬s1|v1)P(¬s1|v2)
0.263 0.167 0.737 0.833
• 1
# $ %&|!& = # !&|%& # $ %&
# !&|%& # $ %& + # !&|%* # $ %* ≈ 0.612
# $ %*|!& = 1 − # $ %&|!& ≈ 0.388
勝利することで戦術s1に 対する信頼度が高まった
• !1
# $ %&| !& = # !&|%& # $ %&
# !&|%& # $ %& + # !&|%* # $ %*
≈ 0.583
# $ %*| !& = 1 − # $ %&| !& ≈ 0.417
勝率が下がることで戦術s1以外 の選択に対する信頼度が下がる
•
試合回数更新
回数 戦術 事前確率 選択率 事後確率
P(v1) P(v2) P(s1) P(v1|s1) P(v2|s1) 1 0 s1 0.500 0.500 0.215 0.612 0.388 2 1 ¬s10.612 0.388 0.774 0.583 0.417 3 2 ¬s10.583 0.417 0.777 0.552 0.448 4 3 s1 0.552 0.448 0.220 0.661 0.339 5 4 s1 0.661 0.339 0.230 0.755 0.245
•
•
•